我们提出了一种从稀疏多视图RGB视频重建可控隐式3D人类模型的新方法。我们的方法在网格表面点上定义神经场景表示,并从人体网格的表面签名距离。我们识别出一种无法区分的问题,当3D空间中的点映射到其最近的网格上的最近的表面点时出现的问题,用于学习表面对齐的神经场景表示。要解决此问题,我们将使用与修改的顶点正常的重心插值提出将点投影到网状表面上。与Zju-Mocap和Human3.6m数据集的实验表明,我们的方法在比现有方法的新颖性和新型姿态合成中实现了更高的质量。我们还表明,我们的方法很容易支持身体形状和衣服的控制。
translated by 谷歌翻译
Discriminativeness is a desirable feature of image captions: captions should describe the characteristic details of input images. However, recent high-performing captioning models, which are trained with reinforcement learning (RL), tend to generate overly generic captions despite their high performance in various other criteria. First, we investigate the cause of the unexpectedly low discriminativeness and show that RL has a deeply rooted side effect of limiting the output words to high-frequency words. The limited vocabulary is a severe bottleneck for discriminativeness as it is difficult for a model to describe the details beyond its vocabulary. Then, based on this identification of the bottleneck, we drastically recast discriminative image captioning as a much simpler task of encouraging low-frequency word generation. Hinted by long-tail classification and debiasing methods, we propose methods that easily switch off-the-shelf RL models to discriminativeness-aware models with only a single-epoch fine-tuning on the part of the parameters. Extensive experiments demonstrate that our methods significantly enhance the discriminativeness of off-the-shelf RL models and even outperform previous discriminativeness-aware methods with much smaller computational costs. Detailed analysis and human evaluation also verify that our methods boost the discriminativeness without sacrificing the overall quality of captions.
translated by 谷歌翻译
临床文本的自动汇总可以减轻医疗专业人员的负担。 “放电摘要”是摘要的一种有希望的应用,因为它们可以从每日住院记录中产生。我们的初步实验表明,放电摘要中有20-31%的描述与住院记录的内容重叠。但是,目前尚不清楚如何从非结构化来源生成摘要。为了分解医师的摘要过程,本研究旨在确定摘要中的最佳粒度。我们首先定义了具有不同粒度的三种摘要单元,以比较放电摘要生成的性能:整个句子,临床段和条款。我们在这项研究中定义了临床细分,旨在表达最小的医学意义概念。为了获得临床细分,有必要在管道的第一阶段自动拆分文本。因此,我们比较了基于规则的方法和一种机器学习方法,而后者在分裂任务中以0.846的F1得分优于构造者。接下来,我们在日本的多机构国家健康记录上,使用三种类型的单元(基于Rouge-1指标)测量了提取性摘要的准确性。使用整个句子,临床段和条款分别为31.91、36.15和25.18的提取性摘要的测量精度分别为31.91、36.15和25.18。我们发现,临床细分的准确性比句子和条款更高。该结果表明,住院记录的汇总需要比面向句子的处理更精细的粒度。尽管我们仅使用日本健康记录,但可以解释如下:医生从患者记录中提取“具有医学意义的概念”并重新组合它们...
translated by 谷歌翻译
我们提出了一种使用预训练的语言模型的新的无监督方法,用于词汇替换。与以前使用语言模型的生成能力预测替代品的方法相比,我们的方法基于上下文化和脱皮的单词嵌入的相似性检索替代品,即单词在多个上下文中的平均上下文表示。我们以英语和意大利语进行实验,并表明我们的方法基本上要优于强大的基准,并在没有任何明确的监督或微调的情况下建立了新的最新技术。我们进一步表明,我们的方法在预测低频替代品方面的表现特别出色,还产生了多种替代候选者列表,从而减少了根据文章 - 名称协议引起的形态寄电或形态句法偏见。
translated by 谷歌翻译
最近的邻居图被广泛用于捕获数据集的几何形状或拓扑。构建此类图的最常见策略之一是基于为每个点选择固定数字K(KNN)。但是,当抽样密度或噪声水平在数据集各不相同时,KNN启发式可能会变得不合适。试图解决此问题的策略通常会引入需要调整的其他参数。我们提出了一种简单的方法,以基于四次正规化的最佳传输,从单个参数构建自适应邻域图。我们的数值实验表明,以这种方式构建的图在无监督和半监督的学习应用中表现出色。
translated by 谷歌翻译
压缩传感一直是依赖线性操作的非常成功的高维信号采集和恢复技术。但是,在存储或处理之前,必须对信号的实际测量进行量化。 1(一个) - 位压缩传感是压缩传感的大量量化版本,在其中,信号的每个线性测量都降低到一个位:测量的符号。一旦收集了足够的测量结果,1位压缩感应中的恢复问题旨在以尽可能准确的方式找到原始信号。恢复问题与学习理论中传统的“半空间学习”问题有关。为了恢复稀疏矢量,从1位测量值中的流行重建方法是二元迭代硬阈值(BIHT)算法。该算法是一种简单的投影次级下降法,尽管该问题的概念性不佳,但已知在经验上均能很好地收敛。 BIHT的收敛性属性在理论上没有合理的理由,除了大量的测量值(即,许多大于$ \ max \ {k^{10},24^{48},k^{3.5}/ k^{3.5}/ \ epsilon \} $,其中$ k $是稀疏性,$ \ epsilon $表示近似错误,甚至该表达式隐藏了其他因素)。在本文中,我们表明,BIHT算法仅通过$ \ tilde {o}收敛(\ frac {k} {\ epsilon})$测量。请注意,这种依赖性对$ k $和$ \ epsilon $对于1位压缩传感中的任何恢复方法都是最佳的。据我们所知,BIHT是唯一需要所有参数($ K $和$ \ epsilon $)中最佳测量值的实用和高效(多项式时间)算法。这也是在适当的结构条件下,梯度下降算法转化为非凸问题的正确解决方案的示例。
translated by 谷歌翻译
在决策过程中使用机器学习技术时,模型的可解释性很重要。在本文中,我们采用了福利添加剂解释(Shap),这是根据许多利益相关者之间的公平利润分配,根据其贡献,用于解释使用医院数据的渐变升级决策树模型。为了更好地解释,我们提出了如下的三种新技术:(1)使用SHAC和(2)所谓的特征包的特征重要性的新度量,该技术被称为一个分组的特征,以允许更容易地了解模型没有模型的重建。然后,将解释结果与Shap框架和现有方法进行比较。此外,我们展示了A / G比如何使用医院数据和所提出的技术作为脑梗死的重要预后因素。
translated by 谷歌翻译
我们提出了一种基于语境化嵌入的单词和实体的全局实体消除歧义(ED)模型。我们的模型基于BERT和培训我们的新培训任务,使模型能够捕获基于Word的本地和基于实体的全局上下文信息。该模型解决了ED作为序列决策任务,有效地使用两种类型的上下文信息。我们在五个标准ED数据集中实现了新的最先进结果:AIDA-CONLL,MSNBC,AQUAINT,ACE2004和WNED-Wiki。我们的源代码和培训的模型检查点可在https://github.com/studio-ousia/luke获得。
translated by 谷歌翻译